在过去的几年中,深度学习用于脑电图(EEG)分类任务一直在迅速增长,但其应用程序受到EEG数据集相对较小的限制。数据扩展包括在培训过程中人为地增加数据集的大小,它一直是在计算机视觉或语音等应用程序中获得最新性能的关键要素。尽管文献中已经提出了一些脑电图数据的增强转换,但它们对跨任务的绩效的积极影响仍然难以捉摸。在这项工作中,我们提出了对主要现有脑电图增强的统一和详尽的分析,该分析在常见的实验环境中进行了比较。我们的结果强调了为睡眠阶段分类和大脑计算机界面界面的最佳数据增强,在某些情况下显示预测功率改善大于10%。
translated by 谷歌翻译
设计对某些数据转换不变的学习系统对于机器学习至关重要。从业人员通常可以通过选择网络体系结构(例如使用卷积进行翻译或使用数据扩展。但是,在网络中实现真正的不变性可能很困难,并且并不总是知道数据不变。学习数据增强策略的最新方法需要持有数据,并且基于双重优化问题,这些问题很复杂,可以解决并且通常在计算上要求。在这项工作中,我们仅从培训数据中研究了学习不断增长的新方法。使用直接在网络中构建的可学习的增强层,我们证明我们的方法非常通用。它可以结合任何类型的可区分扩展,并应用于计算机视觉之外的广泛学习问题。我们提供的经验证据表明,基于二线优化的现代自动数据增强技术比现代自动数据增强技术更容易,更快,同时取得了可比的结果。实验表明,虽然通过自动数据增强传递到模型的不传导受到模型表达性的限制,但我们方法所产生的不变性对设计不敏感。
translated by 谷歌翻译
Depth cues are known to be useful for visual perception. However, direct measurement of depth is often impracticable. Fortunately, though, modern learning-based methods offer promising depth maps by inference in the wild. In this work, we adapt such depth inference models for object segmentation using the objects' ``pop-out'' prior in 3D. The ``pop-out'' is a simple composition prior that assumes objects reside on the background surface. Such compositional prior allows us to reason about objects in the 3D space. More specifically, we adapt the inferred depth maps such that objects can be localized using only 3D information. Such separation, however, requires knowledge about contact surface which we learn using the weak supervision of the segmentation mask. Our intermediate representation of contact surface, and thereby reasoning about objects purely in 3D, allows us to better transfer the depth knowledge into semantics. The proposed adaptation method uses only the depth model without needing the source data used for training, making the learning process efficient and practical. Our experiments on eight datasets of two challenging tasks, namely camouflaged object detection and salient object detection, consistently demonstrate the benefit of our method in terms of both performance and generalizability.
translated by 谷歌翻译
Deconvolution is a widely used strategy to mitigate the blurring and noisy degradation of hyperspectral images~(HSI) generated by the acquisition devices. This issue is usually addressed by solving an ill-posed inverse problem. While investigating proper image priors can enhance the deconvolution performance, it is not trivial to handcraft a powerful regularizer and to set the regularization parameters. To address these issues, in this paper we introduce a tuning-free Plug-and-Play (PnP) algorithm for HSI deconvolution. Specifically, we use the alternating direction method of multipliers (ADMM) to decompose the optimization problem into two iterative sub-problems. A flexible blind 3D denoising network (B3DDN) is designed to learn deep priors and to solve the denoising sub-problem with different noise levels. A measure of 3D residual whiteness is then investigated to adjust the penalty parameters when solving the quadratic sub-problems, as well as a stopping criterion. Experimental results on both simulated and real-world data with ground-truth demonstrate the superiority of the proposed method.
translated by 谷歌翻译
我们提出了一种新型混合电缆的机器人,并使用操纵器和摄像头,用于在垂直水培农场中进行高临界性,中等通量的植物监测,并以示例应用显示出无损的植物质量估计。具有高时空和空间分辨率的植物监测对农民和研究人员都很重要,以检测异常和开发植物生长的预测模型。高质量,现成的结构(SFM)和摄影测量包的可用性使一个充满活力的机器人社区能够将计算机视觉应用于非破坏性植物监测。尽管现有的方法倾向于集中于高通量(例如卫星,无人机(UAV),车辆安装,输送带图像)或对闭塞的高临界/鲁棒性(例如,转弯台式扫描仪或机器人组),,机器人臂),,,,机器人组合我们提出了一个中间地面,该地面可以通过中等通知,高度自动化的机器人获得高精度。我们的设计配对了电缆驱动的平行机器人(CDPR)的工作空间可伸缩性与4度(DOF)机器人臂的敏捷性,以自主对许多植物进行自主对许多植物的想象。我们描述了我们的机器人设计,并通过从64个观点中收集54种植物的每日照片来实验证明它。我们表明,我们的方法可以产生科学有用的测量结果,在初始校准后完全自主运行,并产生更好的重建和植物特性估计值(例如无用的方法)。作为应用程序,我们表明,我们的系统可以成功估计植物质量,平均绝对误差(MAE)为0.586g,并且当用于对质量与年龄之间的关系进行假设测试时,会产生与地面真相相当的P值数据(分别为p = 0.0020和p = 0.0016)。
translated by 谷歌翻译
移动对象检测(MOD)是成功实现安全自动驾驶的关键视觉任务。尽管深度学习方法的结果合理,但大多数现有方法仅基于框架,并且在与动态的交通参与者打交道时可能无法达到合理的性能。传感器技术的最新进展,尤其是事件摄像头,可以自然地补充传统的摄像头方法,以更好地模型移动对象。但是,基于事件的作品通常会采用预定义的时间窗口进行事件表示,并简单地将其集成以估算事件的图像强度,从而忽略了可用异步事件的许多丰富时间信息。因此,从新的角度来看,我们提出了一种新型的RGB事件融合网络Renet,该网络共同利用这两种互补方式,以在挑战性的情况下实现更强大的MOD,以实现自主驾驶。具体而言,我们首先设计一个时间多尺度聚合模块,以完全利用RGB曝光时间和较大间隔的事件框架。然后,我们引入一个双向融合模块,以认真校准和融合多模式特征。为了评估网络的性能,我们仔细选择并从常用的DSEC数据集中选择一个子模型数据集。广泛的实验表明,我们提出的方法的性能明显优于最新的RGB事实融合替代方案。
translated by 谷歌翻译
由多种因素引起的组织学图像的染色变化不仅是病理学家的视觉诊断,而且是细胞分割算法的挑战。为了消除颜色变化,已经提出了许多染色归一化方法。但是,大多数是为苏木精和曙红染色图像而设计的,并且在免疫组织化学染色图像上表现不佳。当前的细胞分割方法系统地将染色归一化作为预处理步骤,但是尚未定量研究颜色变化带来的影响。在本文中,我们制作了五组具有不同颜色的Neun染色图像。我们应用了一种深度学习的图像录制方法来在组织学图像组之间执行色彩转移。最后,我们改变了分割集的颜色,并量化了颜色变化对细胞分割的影响。结果证明了在后续分析之前必须进行颜色归一化的必要性。
translated by 谷歌翻译
姿势估计通常被解决为垃圾箱分类问题或回归问题。在这两种情况下,这个想法都是直接预测对象的姿势。这是一项非平凡的任务,因为不同姿势之间的相似姿势和相似性的外观变化。取而代之的是,我们遵循关键思想,即比较两个姿势要比估计它们更容易。到此为止,已经采用了渲染和能力方法,但是它们往往是不稳定的,计算昂贵的,并且对于实时应用程序而言却很慢。我们建议通过使用动态边缘和连续的姿势标签空间学习对齐度损失来进行类别级别的姿势估计。为了高效的推断,我们使用一个简单的实时图像检索方案,其中包含投影到嵌入空间的参考渲染集。为了实现对现实世界条件的鲁棒性,我们采用合成阻塞,边界盒扰动和外观增强。我们的方法在Pascal3D和OckludedPascal3D上实现了最先进的性能,以及Kitti3d的高质量结果。
translated by 谷歌翻译
功能响应对一组标量预测变量的回归可能是一项具有挑战性的任务,尤其是如果有大量预测因子,这些预测因子具有交互作用,或者这些预测因子与响应之间的关系是非线性的。在这项工作中,我们为此问题提出了一个解决方案:馈送前向神经网络(NN),旨在预测使用标量输入的功能响应。首先,我们将功能响应转换为有限维表示,然后构建了输出此表示形式的NN。我们提出了不同的目标功能来训练NN。所提出的模型适用于定期和不规则间隔的数据,还提供了多种方法来应用粗糙度惩罚以控制预测曲线的平滑度。实现这两个功能的困难在于可以反向传播的目标函数的定义。在我们的实验中,我们证明了我们的模型在多种情况下优于常规尺度回归模型,同时计算缩放的尺寸更好。
translated by 谷歌翻译
本文分析了使用管理设计师要求不确定性的股票弹簧选择工具的优势。首先,描述了手动搜索及其主要缺点。然后,提出了计算机辅助弹簧选择工具,该工具执行所有必要的计算,以从数据库中提取最合适的弹簧。该算法使用多标准分析和模糊逻辑分析了具有间隔值的数据集。列出了两个示例,分别进行了手册和辅助搜索。他们不仅显示了使用辅助搜索的结果明显更好,而且还可以帮助设计师轻松,精确地详细说明其规格,从而提高设计过程的灵活性。
translated by 谷歌翻译